Average word length | # of sentences | Source |
---|---|---|
6.27 | 24 | http://az.wikipedia.org/wiki/FİFA_Dünya_Kubokundakı_rekordlar |
6.36 | 22 | http://az.wikipedia.org/wiki/Pepe_(futbolçu) |
6.43 | 23 | http://az.wikipedia.org/wiki/Qan_qrupları |
6.56 | 10 | http://az.wikipedia.org/wiki/Robert_Uodlou |
6.59 | 13 | http://az.wikipedia.org/wiki/Dəcəl_öpüş_(teleserial,_2010) |
6.72 | 21 | http://az.wikipedia.org/wiki/Ədat |
6.80 | 12 | http://az.wikipedia.org/wiki/Sevgi,_sevgi,_sevgi_(film,_1989) |
6.84 | 22 | http://az.wikipedia.org/wiki/Maks_Barskix |
6.86 | 16 | http://az.wikipedia.org/wiki/Mfo_Kqasvane |
6.89 | 17 | http://az.wikipedia.org/wiki/Uilyams_(Formula_1_komandası) |
6.90 | 15 | http://az.wikipedia.org/wiki/Boban_Maryanoviç |
6.91 | 13 | http://az.wikipedia.org/wiki/Makura_no_Danshi |
6.92 | 10 | http://az.wikipedia.org/wiki/Allel |
6.93 | 22 | http://az.wikipedia.org/wiki/Karateçi_uşaq_(film,_2010) |
6.93 | 13 | http://az.wikipedia.org/wiki/Abbasqulu_Nəcəfzadə |
6.95 | 15 | http://az.wikipedia.org/wiki/Liu_Yi_Fei |
6.95 | 14 | http://az.wikipedia.org/wiki/Aldo_Boffi |
6.95 | 12 | http://az.wikipedia.org/wiki/Panzar:_Forged_by_chaos |
6.96 | 10 | http://az.wikipedia.org/wiki/Türkiyə_Superkubokunu_qazanan_baş_məşqçilərin_siyahısı |
6.97 | 12 | http://az.wikipedia.org/wiki/Avara_(film,_1951) |
6.98 | 12 | http://az.wikipedia.org/wiki/Nyuport_(Oreqon) |
6.98 | 11 | http://az.wikipedia.org/wiki/Parfiyalı_Muza |
6.99 | 10 | http://az.wikipedia.org/wiki/Qış_xan |
7.04 | 11 | http://az.wikipedia.org/wiki/Alaş_xan |
7.06 | 12 | http://az.wikipedia.org/wiki/Qastone_Bin |
7.06 | 11 | http://az.wikipedia.org/wiki/Yeraltı_hamam_(Şəki) |
7.08 | 10 | http://az.wikipedia.org/wiki/Samurlar |
7.09 | 12 | http://az.wikipedia.org/wiki/Çester_Benninqton |
7.09 | 10 | http://az.wikipedia.org/wiki/Ervin_Skela |
7.12 | 12 | http://az.wikipedia.org/wiki/Mika |
Average word length | # of sentences | Source |
---|---|---|
11.62 | 14 | http://az.wikipedia.org/wiki/Südləyən |
11.55 | 11 | http://az.wikipedia.org/wiki/Kolxida_bigəvəri |
11.31 | 12 | http://az.wikipedia.org/wiki/Milli_Hidrometeorologiya_Xidməti |
11.25 | 11 | http://az.wikipedia.org/wiki/Vəliyulla_Cəfərov |
11.24 | 10 | http://az.wikipedia.org/wiki/Nəcəf_Nəcəfov_(dosent) |
11.20 | 10 | http://az.wikipedia.org/wiki/Elman_Cəfərli |
11.19 | 10 | http://az.wikipedia.org/wiki/Dünya_Azərbaycanlılarının_II_Qurultayı |
11.14 | 21 | http://az.wikipedia.org/wiki/Angioprotektorlar |
11.12 | 11 | http://az.wikipedia.org/wiki/Yumşaq_şinus |
11.11 | 12 | http://az.wikipedia.org/wiki/Dünyа_əhаlisinin_dini_tərkibi |
11.05 | 10 | http://az.wikipedia.org/wiki/Çin_aktinidiyası |
11.05 | 10 | http://az.wikipedia.org/wiki/Kamandar_Şərifov |
11.02 | 11 | http://az.wikipedia.org/wiki/Landşaftşünaslıq |
11.00 | 17 | http://az.wikipedia.org/wiki/Cümşüd_Abbasov |
10.99 | 30 | http://az.wikipedia.org/wiki/Çingiz_Cuvarlı |
10.93 | 12 | http://az.wikipedia.org/wiki/Əli_Abbasov |
10.86 | 14 | http://az.wikipedia.org/wiki/Benilüks_Azərbaycanlıları_Konqresinin_qurultayları |
10.84 | 11 | http://az.wikipedia.org/wiki/Razil_Vəliyev |
10.84 | 11 | http://az.wikipedia.org/wiki/Cavanşir_Feyziyev |
10.82 | 11 | http://az.wikipedia.org/wiki/Vidadi_Musayev |
10.76 | 26 | http://az.wikipedia.org/wiki/Fruktozo-2,6-bisfosfat |
10.75 | 10 | http://az.wikipedia.org/wiki/İradə_Əliyeva_(professor) |
10.74 | 20 | http://az.wikipedia.org/wiki/Respublika_Elmi_Kənd_Təsərrüfatı_Kitabxanası |
10.74 | 17 | http://az.wikipedia.org/wiki/Azərbaycan_Respublikasının_Konstitusiyası |
10.72 | 11 | http://az.wikipedia.org/wiki/Qafqaz_Konfederasiyası |
10.72 | 10 | http://az.wikipedia.org/wiki/İttihad_fraksiyası |
10.71 | 11 | http://az.wikipedia.org/wiki/Avtomatlaşdırılma_mühəndisliyi |
10.70 | 15 | http://az.wikipedia.org/wiki/Bəxtiyar_Əliyev |
10.66 | 12 | http://az.wikipedia.org/wiki/Klonal_seleksiya_nəzəriyyəsi |
10.65 | 16 | http://az.wikipedia.org/wiki/Məmməd_Çıraqov |
The problem addressed in this subsection (as well as the results) is similar to 6.4.1.1, but now we focus on average word length instead of average sentence length.
Measuring average word length strongly depends on tokenization. The usual tokenization might split the string “28.06.2005” into five parts “28 . 06 . 2005” of average length two. To avoid this, the number of words is counted as 1 + (number of blanks in the sentence).
select round(avg(length(sentence) / (1+ length(sentence) - length(replace(sentence," ","")))),2) as le, count(sentence) as cnt, source from sentences s, inv_so i, sources so where s.s_id=i.s_id and i.so_id=so.so_id group by source having cnt>=10 order by le limit 30;
6.4.2.2 Average logarithmic word rank for different sources
6.4.2.3 Sources consisting of many / few words with frequency 1
6.4.2.4 Sources with low / high average word length of rare words